De Hackeos de Recompensa a Estados de Riesgo: Monitoreo Contextual en Agentes Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa. 2026-06-06 · 2 min